Tại sao Multidimesional data lại quan trọng?

  • Hiểu rõ hơn về dữ liệu
  • Phát hiện xu hướng và mẫu tiềm ẩn
  • Hỗ trợ đưa ra quyết định chính xác hơn
  • Tối ưu hoá quy trình

Phân loại dữ liệu

Pasted image 20250329072727.png

1 chiều

Pasted image 20250329073020.png

2 chiều

Pasted image 20250329073041.png

3 chiều

Pasted image 20250329073106.png

đa chiều

Pasted image 20250329073117.png

Trực quan hoá

Bối cảnh

Tập dữ liệu Auto MPG được thu thập để ghi nhận lại đặc điểm kỹ thuật các dòng xe hơi trong khoảng từ năm 1970 đến 1982.
Tập dữ liệu được tạo ra để hỗ trợ việc đánh giá hiệu suất nhiên liệu (MPG - miles per gallon) của các mẫu xe khác nhau, giúp người tiêu dùng và các nhà sản xuất xe hơi hiểu rõ hơn về:

  • Xu hướng tiêu thụ nhiên liệu qua các năm.
  • Ảnh hưởng của các thông số kỹ thuật (trọng lượng, công suất, số xi-lanh, v.v.) đến hiệu suất nhiên liệu.
  • So sánh giữa khu vực (Mỹ, Nhật Bản, châu Âu).

Tổng quan về dữ liệu

Pasted image 20250329073343.png

Trực quan theo 1D

Câu hỏi đặt ra:

  • Xe trong quá khứ có mức tiêu hao nhiên liệu (MPG) là bao nhiêu? 
  • Giá trị MPG phân bố thế nào giữa các mẫu xe?

Thực thi hoá:

Pasted image 20250329073511.png

Trực quan theo 2D

Câu hổi đặt ra:

Liệu rằng xe có trọng lượng nặng hơn có xu hướng tiêu thụ nhiên liệu kém hiệu quả hơn không?

Thực thi hoá:

Pasted image 20250329073624.png


Câu hỏi đặt ra:

  • Liệu rằng xe có trọng lượng nặng hơn có xu hướng tiêu thụ nhiên liệu kém hiệu quả hơn không?
  • Các thuộc tính nào trong tập dữ liệu có mối tương quan mạnh nhất với MPG ? Ngoài ra, các thuộc tính có mối liên quan nào với nhau không?

Thực thi hoá:

Pasted image 20250329073849.png


Câu hỏi đặt ra

  • Liệu rằng xe có trọng lượng nặng hơn có xu hướng tiêu thụ nhiên liệu kém hiệu quả hơn không?
  • Các thuộc tính nào trong tập dữ liệu có mối tương quan mạnh nhất với MPG ? Ngoài ra, các thuộc tính có mối liên quan nào với nhau không?
  • Mức tiêu thụ nhiên liệu (MPG) thay đổi như thế nào theo số xi-lanh?

Thực thi hoá

Pasted image 20250329074352.png

Biểu đồ Swarmplot

Pasted image 20250329074542.png


Câu hỏi đặt ra

Điều đồ toạ độ song song (Parallel Coordinates)

Quá trình hình thành

Pasted image 20250329074724.png
Pasted image 20250329074738.png
Pasted image 20250329074750.png
Pasted image 20250329074807.png
Pasted image 20250329074817.png
Pasted image 20250329074826.png

Lý thuyết

Parallel Coordinates (tọa độ song song) là một phương pháp trực quan hóa dữ liệu đa chiều, trong đó mỗi chiều dữ liệu được biểu diễn bởi một trục thẳng đứng song song. Mỗi điểm dữ liệu trong không gian nhiều chiều được biểu diễn bằng một đường đa giác nối các trục tương ứng với các giá trị của nó.

Ví dụ, nếu một tập dữ liệu có 5 thuộc tính, ta sẽ có 5 trục thẳng đứng song song, và mỗi điểm dữ liệu sẽ là một đường nối các giá trị tương ứng trên các trục đó.

Ưu nhược điểm

Pasted image 20250329074929.png

BIỂU TƯỢNG MẶT CHERNOFF (CHERNOFF FACE)

Định nghĩa

Chernoff Faces là một phương pháp trực quan hóa dữ liệu đa chiều bằng cách biểu diễn mỗi điểm dữ liệu dưới dạng một khuôn mặt người, trong đó các thuộc tính dữ liệu điều khiển các đặc điểm của khuôn mặt (như kích thước mắt, độ cong miệng, chiều dài mũi, v.v.).

Quy trình thực hiện

Pasted image 20250329075153.png

Ứng dụng

Phân tích chất lượng cuộc sống ở những vùng tại Los Angeles
Pasted image 20250329075239.png

Ưu nhược điểm

Pasted image 20250329075314.png

Biểu tượng ngôi sao (Star Glyph)

Pasted image 20250329075406.png

Định nghĩa

Star Glyphs (hay còn gọi là Star Plots hoặc Radar Charts) là một phương pháp trực quan hóa dữ liệu đa chiều bằng cách biểu diễn mỗi điểm dữ liệu dưới dạng một đa giác hình sao. Mỗi trục của hình sao tương ứng với một thuộc tính (feature), và giá trị của thuộc tính đó xác định độ dài của tia (ray) trên trục.

Ưu nhược điểm

Pasted image 20250329075438.png